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RAPPORT DE RECHERCHE INTERNATIONALE 
(article 18 et regies 43 et 44 du PCT) 



Reference du dossier du deposant ou 
du mandataire 

BCT000066/BLO 


POUR SUITE voir la notification de transmission du rapport de recherche internationale 
(formulaire PCT/ISA/220) et, le cas echeant, le point 5 ci-apres 

ADONNER 


Demande international n° 

PCT/FR 00/02220 


Date du depot \n\.emeX\ona\(jour/mois/annee) 

02/08/2000 


(Date de priorite (la plus ancienne) 
(jour/mois/annee) 

04/08/1999 


Deposant 

MATRA NORTEL COMMUNICATIONS 



Le present rapport de recherche internationale, etabli par radministration chargee de la recherche internationale, est transmis au 
deposant conformement a ('article 1 8. Une copie en est transmise au Bureau international. 

Ce rapport de recherche internationale comprend 3 feuilles. 

PH H est aussi accompagne d'une copie de chaque document relatrf a I'etat de la technique qui y est cite. 



1. Base du rapport 

a. En ce qui concerne la langue, la recherche internationale a ete effectuee sur la base de la demande internationale dans la 
langue dans laquelle efle a ete deposee, sauf indication contraire donnee sous le meme point 

| | la recherche internationale a ete effectuee sur la base d'une traduction de la demande internationale remise a radministration. 

b. En ce qui concerne les sequences de nucleotides ou d'acldes amines divulguees dans la demande internationale (le cas echeant) 
la recherche internationale a ete effectuee sur la base du listage des sequences : 

| | contenu dans la demande internationale, sous forme ecrite. 

deposee avec la demande internationale, sous forme dechiffrable par ordinateur. 
rem is ulterieurement a radministration, sous forme ecrite. 
remis ulterieurement a radministration, sous forme dechiffrable par ordinateur. 

La declaration, selon laquelle le listage des sequences presente par ecrrt et fourni ulterieurement ne vas pas au-dela de la 
divulgation faite dans la demande telle que deposee, a ete fournie. 



2. 
3. 



6. 



□ 
□ 
□ 
□ 

□ 

□ 

□ 



La declaration, selon laquelle les informations enregistrees sous forme dechiffrable par ordinateur sont identiques a celles 
du listage des sequences presente par ecrit, a ete fournie. 

II a 6t€ estlme que certalnes revendlcatlons ne pouvalent pas fa I re I'objet d'une recherche (voir le cadre I). 
II y a absence d'unrte" de ^Invention (voir le cadre II). 



4. En ce qui concerne le tltre, 

[X] le texte est approuve tel qu'il a ete remis par le deposant. 

| [ Le texte a ete etabli par radministration et a la teneur suivante: 



En ce qui concerne l'abrege\ 

le texte est approuve tel qu'il a ete remis par le deposant 

□ 



le texte (reproduit dans le cadre III) a ete etabli par radministration conformement a la regie 38.2b). Le deposant peut 
presenter des observations a radministration dans un delai d'un mois a compter de la date'3'expedition du present rapport 
de recherche internationale. 

La figure des desslns a publier avec I'abrege est la Figure n° ^ 2_ 



PT| suggeree par le deposant. 

| | parce que le deposant n'a pas suggere de figure. 

| | parce que cette figure caracterise mieux I' invention. 



□ 



Aucune des figures 
n'est a publier. 



t 



Formulaire PCT/ISA/210 (premiere feuille) Guillet 1998) 



09/806756 



PCT 



REQUETE 



Le soussigne requiert que la presente demande 
internationale soit traitee con form ement au Traite de 
cooperation en matiere de brevets. 



Reserve a ! f office recepteur 



Demande internationale n° 



Date du depot international 



Nom de r office recepteur et '"Demande internationale PCT" 



Reference du dossier du deposant ou du mandataire (facultatif) 



(12 caracteres au maximum) 



BCT00OO66/BLO 



Cadre n" I TITRE DE [/INVENTION 

PROCEDE ET DISPOSITIF DE DETECTION D'ACTIVITE VOCALE. 



Cadre n" II DEPOSANT 



Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
ojfic telle complete. L ' ad r esse doit comprendre le code postal et le nom du pays. Le^pays de 
I ad r esse indiquee dans ce cadre est I 'Etat oil le deposant a son domicile si ducun domicile 
n est indique ci-dessous.) 

MATRA NORTEL COMMUNICATIONS 

50 rue du President Sadate 

29100 QUIMPER 
FRANCE 



□ 



Cette personne est aussi 
inventeur. 



n" dc telephone 



n° de telecopieur 



n° de teleimprimeur 



Nationality (nom de THtat) 



FR 



Domicile (nom de I'Etat) : 



FR 



Cette personne est 
deposant pour : 



□ tousles Luts r—n tous.lcs Ltats desienes sauf 
designcs I A I les Ltats-Unis d'Amcrique 



□ les Filats-Unisd'Amcrique i 1 | cs t£ ta ts indiques dans 
sculement | | | c cadre suppiementairc 



Cadre n" III AUTRE(S) DEPOSANT(S) OU (AUTRE(S)) INVENTEUR(S) 



Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
ojficielle complete. L 'adresse doit comprendre le code postal et le nom du pays. Le pays de 
I adresse indiquee dans ce cadre est I 'Etat oil le deposant a son domicile si ducun domicile 
n 'est indique ci-dessous.) 

LUBIARZ Stephane 
4 avenue Leon Heuzey 
75016 PARIS 
FRANCE 



Cette personne est : 

| | deposant seulement 

[ X| deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee. 
ne pas remplir la suite.) 



Nationality (nom de I'Liat) : 



FR 



Domicile (nom de I'Etat) : 



FR 



Cette personne est 
deposant pour : 



□ lous Ics Elats I I tous les Rials designcs sauf j 1 Ics Etats-Unis d'Amerique [ [ les Rtats indiques dans 
designcs | | les F.tats-linis d'Amerique I X I sculement | | le cadre supplemental 



D'autres deposants ou inventeurs sont indiques sur une feuille annexe. 



Cadre n" IV MANDATAIRE OU REPRESENTANT COMMUN; OU ADRESSE POUR LA CORRESPONDANCE 



La personne dont Tidentite est donnee ci-dessous esi/a etc designee pour agir au nom du ou 
des deposants auprcs des autorites intemationalcs competentes, commc: 



X mandataire | | representant commun 



Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation ojficielle 
complete. L 'adresse doit comprendre le code postal et le nom du pays.) 

L0ISEL Bertrand 
CABINET PLASSERAUD 
84 rue d 'Amsterdam 
75440 PARIS CEDEX 09 

FRANCE 



n° dc telephone 

01 44 63 41 11 



n J de telecopieur 

01 42 80 01 59 



n° de teleimprimeur 



□ 



Adresse pour la correspondence : cocher cette case lorsque aucun mandataire ni representant commun n'est/n'a ete designe" 
et que Tespace ci-dessus est utilise pour indiquer une adresse speciale a laquelle la correspondance doit etre envoyee. 



Formulaire PCT/RO/101 (premiere feuille) (juillct 1998; reimprcssion janvier 2000) 



Voir les notes relatives au formulaire de requete 



Express Mail No. EL732849804US 



Feuille n° 



Suite du cadre n" III ALTRE(S) DEPOSANT(S) OU (AUTRE(S)) INVENTEUR(S) 


Si aucun des sous-cadres suivants n 'est utilise, cette feutlle ne doit pas etre incluse dans la requete. 


Norn el adresse : (Norn de Jamil ie suivi du pre nam; pour une personne morale, designation 
officielle complete, i 'adresse doit comprendre le code postal et le nom du pays. Lepays de 
(' adresse indiquee dans ce cadre est I ttat oil le deposant a son domicile si aucun domicile 
n est indique ci-dessous.) 

HINARD Edouard 

26 rue de la Federation 

75015 PARIS 

FRANCE 


Cette personne est : 

| | deposant seulemeni 

[ X | deposant et inventeur 

| | inventeur seulement 

(Si cette case est cochee. 
ne pas remplir la suite.) 


Nationality (nom dc I'Etat) : 

FR 


Domicile (nom de TEtat) : 

FR 


Colic personne est 1 j urns les Etats I 1 tous les Etats designes i;aul* les Etats-Unis d'Amerique 1 1 les Etats indiques dans 
deposant pour : 1 i designes 1 1 les Etats-Unis d'Amerique LJU seulement 1 I lc cadre supplementaire 


Nom et adresse : (Nom de Jamil I e suivi du pre nom; pour une personne morale, designation 
ojjicielle complete. L adresse doit comprendre le code postal el le nom du pa vs. Le'pavs de 
I adresse indiquee dans ce cadre est I 'Etal oil le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

CAPMAN Francois 

47 rue des Etats Generaux 

78000 VERSAILLES 
FRANCE 


Cette personne est : 

| | deposant seulement 

| deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee. 
ne pas remplir la suite.) 


Nationality (nom de I'Etat) : 

FR 


Domicile (nom de I'Etat) : „ 

FR 


Celte personne est 1 | tous les Etats | I tous. les Bats designes sauf T~~y\ les Etais-Unis d'Amerique 1 1 les Etats indigues dans 

deposant pour : I I designes j | | C s Etats-Unis d'Amerique 1 ^1 seulement | | le cadre supplementaire 


Nom el adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code postal et le nom du pavs. Le pays de 
f adresse indiquee dans ce cadre est t 'ttat oil le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

L0CKW00D Philip 
10 rue DE L-'-Amazone 
95490 VAUREAL 
FRANCE 


Cette personne est : 

| | deposant seulement 

| X] deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee. 
ne pas remplir la suite.) 


Nationality (nom de I'Etat) : 

FR 


Domicile (nom de EEtat) : 

FR 


Cette personne est 1 1 tousles Etats 1 1 tous. les Etats designes sauf Y les Etats-Unis d Amerique 1 1 les Etats indiques dans 

deposant pour • 1 1 designes | | ks Etats-Unis d'Amerique a seulement | | le cadre supplementaire 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code postal et le nom du pays. Le pays de 
I adresse indiquee dans ce cadre est I 'ttat ou le deposant a son domicile si aucun domicile 
n est indique ci-dessous.) 


Cette personne est : 

| | deposant seulement 

| | deposant et inventeur 

| j inventeur seulement 

(Si cette case est cochee. 
ne pas remplir la suite.) 


Nationality" (nom de I'Etat) : 


Domicile (nom de I'Etat) : 


Cette personne est 1 1 tous les Etats 1 I tous. les Elals designed sauf 1 1 les Etats-Unis d'Amerique I 1 les Etats indiques dans 

deposant pour : 1 1 designes 1 1 les Etats-Unis d'Amerique | | seulement | | le cadre supplementaire 


| | D'autres deposants ou inventeurs sont indiques sur une autre feuille annexe. 



Kormulaire PCT/KO/IOI (feuille annexe) (juillel 1 998; rcimpression janvier 2000) Voir les notes relatives au formulaire de requete 



J Cadre n* V DESIGNATION p;,ETATS 



Les designations suivantes sontj 
Brevet regional 
53 AP Brevet ARIPO : CH 



conformement a la regie 4.9.a) (cocher le7cases^^f> { 



priees: une au mo ins doit I'etre) 



| -S3 EA 

a eh 



le brevet curasien et du PCT 
Brevet europeen : AT Autriche, 



BE 



Mauritanie, NE Niger, SiN Senegal, 
Etat conrractant du PCT (si une autre forme 



DK Oanernar,. ES Espagne, FI Ffn£^ 

b^SJJ; 5^ " POrTUSaK SE **" " ™ ™ ^ « ^ tai "o^ rractan t de fa 

fl ° A rxVr Z ° API V^'^/^ 0 ' BJ B * nin * CF R ^ ut >iique centrafricaine. CC Congo CI Cote d'lvoire 
^ , -r C ^ er ^V GA Gabon ' ClN Cu.nee, CW Guinee-Bissau, ML Mali MR " ? - • ' _iv 0I re. 

TD Tchad, TG Togo et tout autre Etat qui est un Etat membre de POAPI et 'un 

de protection ou de trattement est souhaitee, le preciser sur la tigne pointillee) 

Brevet national (si une autre forme de protection oudetraitemem est souhaitee. le preciser sur la ligne pointillee): 
GJ AE Emirats arabes unis 
An tigua-et- Barbuda 

Albanie g] 

Armenie gj 

Autriche 

AustraJie _gj 

Azerbaidjan 

Bosnie-Herzegovine 

Barbade gg 

Bulgarie g] 

Bresil jgj 

Belarus 

Belize jg] 

Canada g] 

H CH et LI Suisse et Liechtenstein gj 

S CiN Chine rg 

Costa Rica gj 

Cuba Jg] 

Republique tcheque gj 

Allemagjie Q5J 

Danemaric (3 

Dominique 

Algerie g] 

Estonie Jgj 

Espagne gj 

Finlande [g| 

Royaume-Uni 0 

Grenade gj 

Georgie g] 

Ghana g] 

Gambie 

Croatie ^ 

Hongrie j3 

Indonesie 

'srael gj 

Inde 

Islande gj 

^pon gj 

Kenva 13 

K^hizistan JS ZW Zimbabwe 

Republique populaire democratique de Coree n 

ReDubliaue de Toreff res ^ rvee pour la designation d 'Etats qui son t devenus parties au 

Kepuoi.que de Loree PCT apres Ia publication de la presence feuille ■ 

Kazaichstan q 



a ag 
a al 
a am 
a at 
a au 

13 AZ 

JS BA 
£3 BB 
SI BG 

a br 

IS BY 
H BZ 
H CA 



B cr 
H cu 
IS cz 

a de 

JS DM 

J5 Dz 
J2 EE 
J3 ES 

ja fi 

EI GB 
JSJ GD 
J3 GE 

J3 CM 
(2 HR 
JS HU 

ja id 

B in 
IS is 

a JP 

JS K£ 

ja kg 

J0 KP 

h kr 
a kz 



TZ 
UA 
UG 
US 

uz 

VN 
YU 
ZA 



Sainte-Lucie 
Sri Lanka 
Liberia 

Lesotho 

Liruanie 
Luxembourg 
Lertonie 

Maroc 

Republique de Moldova 

Madagascar 

Ex-Repubtique yougoslave de Macedoine 
Mongolie 

MW Malawi 

MX Mexique 

Mozambique 
Norvege 

Nouvelle-Zelande 

Pologne 

Portugal 

Roumanie 

Federation de Russie 

Soudan 
Suede 
Singapour 

Slovenie 

Slovaquie 

Sierra Leone 

Tadjikistan 

Turkmenistan 

Turquie 

Trinite-et-Tobago 

Republique-Unie de Tanzanie 
Ukraine 



LK 
LR 
LS 
LT 
LU 
LV 
MA 
MD 
MG 
MK 
MiN 



MZ 
iNO 
NZ 
PL 
PT 
RO 
RU 
SD 
SE 
SG 
SI 
SK 
SL 
TJ 
TM 
TR 



Ouganda . . 
Etats-Unis d 
Ouzbekistan . . 
Viet Nam 
Yougoslavie . . 
Afrique du Sud 



Amerique 



a brS 4 9 ou?, e f s i!^ g P recaution . : ° utre '« designations fai.es ci-dcssus. le deposan, fait aussi confonnemenc 

a la regie 4.9.b) toutes les designations qu. seraient autonsees en venu du PCT, i Inception de toute designation indiaueedans le cadre 
upplementa.re comme etant exclue de la portee de cette declaration. Le deposant declare que c« dSSs^^^ 
£ a JS?/, 'n efVe r d e H C0 " f r af ' 0 " et toute designation qui n 'est pas confirmee avant I •ciir^^^^^^^^ 



Formulaire PCT/RO/IOl (dcuxiemc feuille) (juillet 2000) 



Voir les notes relatives au formulaire de requite 



Cadre n n VI 



revendicationTIFprjorite 



Fcuille n° 



□ 



inoiqt 



^ res revendications dc priorite sont 
Iguees dans Ic cadre supplementaire. 



Daic dc depot 
dc la demande anierieure 
(jour/mois/annee) 


Numero 
dc la demande anterieure 


Lorsque la demande anterieure est une : 


demande nationale : 
pays 


demande rcgionale :* 
office regional 


demande internaiionalc : 
office recepteur 


(l) ' (04.08.1999) 
04 AOUT 1999 


99 10128 


FRANCE 






(2) 










(3) 











□ 



L' office recepteur est prie de preparer et dc transmettre au Bureau international une copie certifiee con forme de la ou des demandes 
anterieures (seulement si la demande anterieure a ete deposee aupres de I 'office qui. aux fins de 

ia presente demande Internationale, est I 'office recepteur) indiquces ci-dessus au(x) point(s) : 



• Si la demande antcrieurc est une demande ARIPO. i! est ohligatoire d'indiquer dans le cadre supplemental au mo ins un pays partie a la Convention 
de Paris pour la protection de la propnete industrieile pour lequel cette demande anterieure a ete deposee (regie 4. /Q.b)ii)K l oir le cadre supplemental. 



Cadre n" VII ADMINISTRATION CHARGEE DE LA RECHERCHE INTERNATIONALE 



Choix de ('administration chargee de la recherche 
international (ISA) (si plusieurs administrations 
chargee s de la recherche Internationale sont competenies 
pour procedcr d la recherche iniernationale. indiquer 
I 'administration choisie: le code d deux lettres pent etre 
utilise) : 

ISA/ EP 



Demande d 'utilisation des res u I tats d'une recherche anterieure; mention de 
cette recherche (si une recherche anterieure a ete effectuee par I administration 
chargee de la recherche iniernationale ou demandee a cette derniere) : 

Dale (jour/mois/annee) Numero Pays (ou office regional) 



3 avril 2000 



FA 580092 



France 



Cadre n° VIII BORDEREAU; LANGUE DE DEPOT 



La presente demande iniernationale contient 
le nombre de feu i lies suivant : 



requete 

description (sauf partie reservec 
au listage des sequences) : 

rcvendicaiions 

abrege 

dessins 

partie de !a description reservec 
au listage des sequences 

Nombre total de feuilles 



4 
18 

3 
1 
5 



31 



Le ou tes elements coches ci-apres sont joints a la presente demande iniernationale : 

1. [3 feuilte de calcul des taxes 

2. □ pouvoir distinct signe 

3. □ copie du pouvoir general; numero de reference, le cas echeant : 

4. □ explication de P absence d'une signature 

5. □ document(s) de priorite indique(s) dans le cadre n° VI au(x) point(s) : 

6. □ traduction de la demande intemationale en (langue) : 

7. □ indications separees concernant des micro-organ ismes ou autre materiel 

biologique deposes 

8. Q listage des sequences de nucleotides ou d'acides amines sous forme 

dechlffrable par ordinateur 

autres elements (preciser) : Copie du rapport de recherche 



Figure des dessins qui 

doit accompagner I'abrege : 


Langue de depot de la „ 

demande iniernationale : rranc^ais 


Cadre n° IX SIGNATURE DU D EPOS A NT OU DU (V1ANDATAIRE 



A cote de chaque signature, indiquer le nam du signataire et. si cela n apparait pas clairement d la lecture de la requete, d quel litre I interesse signe. 

Paris, le 2 aout 
L0ISEL Bertrand 




Reserve a T office recepteur 



1. Date effective de reception des pieces supposecs 
consumer la demande iniernationale : 



3. Date effective de reception, rectifiee en raison de la reception ulte- 
rieurc, mais dans les delais. de documents ou de dessins completant ce 
qui est suppose consiiluer la demande iniernationale : 



4. Date de reception, dans les delais, des corrections 
demandees selon Particle I 1.2) du PCT : 



2. Dessins : 
| ] recus : 



□ 



non recus : 



5. Administration chargee dc la recherche fC j a / 
iniernationale (si plusieurs sont competenies) : loA / 



6. I | Transmission de la copie de recherche differee 
I I jusqu'au paiement de la taxe de recherche. 



Date de reception dc I'exemplaire 
original par le Bureau international : 



Reserve au Bureau international 



Formulaire PCT/RO/I0I (derniere fcuille) Quillet |99K; rcimpression janvier 2000) 



Voir les notes relatives au formulaire de requete 



INTERNATIONAL SEARCH REPORT 



^9/806756 



Internal' I Application No 

PCT/FR 00/02220 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 7 G10L11/02 



According to International Patent Classification (IPO or to bom national classification and IPC 



a FIELDS SEARCHED 



Minimum documentation searched (classification system followed by classification symbols) 

IPC 7 G10L 



(Documentation searched other than rronimum documentation to the extent that sucn documents are included in the fields searcned 



aectromc data base consulted dunng Tie international search (name of data base and. wnere practical, searcn terms used) 

EPO-Internal, WPI Data, INSPEC, IBM-TDB 



C- DOCUMENTS CONSIDERED TO BE RELEVANT 



Category ° C ration of document, with indication, where appropriate, of the relevant passages 



Relevant to claim No. 



US 4 982 341 A (LAURENT PIERRE A) 
1 January 1991 (1991-01-01) 

abstract; figures 1,2 

column 1, line 46 -column 2, line 23 

column 4, line 25-42 



1,2, 

11-15 

3 



US 4 682 361 A (SELBACH 8ERN0 
21 July 1987 (1987-07-21) 
abstract 

column 2, line 21-42 



ET AL) 



FR 2 768 544 A (MATRA COMMUNICATION) 

19 March 1999 (1999-03-19) 

cited in the application 

abstract; figure 1 

page 1, line 22 -page 2, line 6 

-/— 



1,13-15 



m 



Further documents are listed in (he continuation of box C. 



Patent family members are listed in annex. 



° Special categories of cited documents : 

*A' document defining the genera* state of the art which is not 

considered to be of particular relevance 
*E" earlier document but published on or after the international 

filing date 

*L' document which may throw doubts on priority claim(s) or 
which is cited to establish the publication date of another 
citation or other special reason (as specified) 

'O* document referring to an oral disclosure, use, exhibition or 
other means 

*P* document published poor to the international filing date but 
later than the priority date d aimed 



T* later document published after the international filing date 
or priority date and not in conflict witn the application but 
cited to understand the principle or theory underlying the 
invention 

*X* document of particular relevance: the claimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step when the document is taken alone 

"Y* document of pamcutar relevance: the claimed invention 

cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
in the an. 

"4* document member of the same patent family 



Date of the actual completion of the intemationai searcn 



1 November 2000 



Oate of maiting of the intemationai search report 



08/11/2000 



Name and mailing address of the ISA 

European Patent Office. P.B. 5818 Patentlaan 2 
NL - 2280 HV RHswijk 
Tel. (+01 -70) 340-2040. Tx. 31 65 1 epo ni. 
Fax: (+31-70) 340-3016 



Authorized officer 



Quelavoine, R 



Form PCT/1SA/210 (SMond sftoot) (Jury 1992) 



page 1 of 2 



Express Mail No. EL732849804US 



INTERNATIONAL SEARCH REPORT 



Intern? al Application No 

PCT/FR 00/02220 



C.(ContinuaUonft DOCUMENTS CONSIDERED TO BE RELEVANT 



Caiegosv J j Citaoon of docunem. vwth tnarcanoruwnem appropriate, of mo relevant passages 


Relevant to damn No. 


A 


US 4 975 657 A (EASTMOND BRUCE C) 
4 December 1990 (1990-12-04) 
abstract; figure 1 

column 1, line 63 -column 2, line 28 


1-3 



Porm PCT.1SA/210 (corranuaocn at svccro sn***t (JUy 199S) 



page 2 of 2 



INTERNATIONAL SEARCH REPORT 

b.. ~»ntAtion on pattern family monttwrs 



1 Application No 

PCT/FK 00/02220 



Patent document 


Publication 




Patent family. 




Kuoucaxion 


Cu9Q in 9COJUI i eporx 


date 




members) 




dat 

>* 


US 4982341 A 


01-01-1991 


FR 


2631147 


A 


10-11-1989 




AT 


83578 


T 


15-01-1993 






TA 




A 
n 


U3 Ui 177J 






0E 


68903872 


D 


28-01-1993 






DE 


68903872 


T 


24-06-1993 






EP 


0341128 


A 


08-11-1989 






ES 


2036813 


T 


01-06-1993 






GR 


3007361 


T 


30-07-1993 






JP 


2013999 


A 


18-01-1990 


US 4682361 A 


21-07-1987 


DE 


3243232 


A 


24-05-1984 




•• AU 


561287 


B 


07-05-1987 






AU 


2154683 


A 


31-05-1984 






CA 


1206620 


A 


24-06-1986 






EP 


0111947 


A 


27-06-1984 






JP 


59105696 


A 


-19-06-1984 



FR 2768544 A 19-03-1999 AU 9168898 A 05-04-1999 

EP 1016071 A 05-07-2000 
W0 9914737 A 25-03-1999 



US 4975657 A 04-12-1990 NONE 



Form PCT/1SA/210 (pa tor* (anHy mnm (JUy 1 9«2) 



(12) DEMANDE INTERNATIONALE PUB LI EE EN VERTU DU TRAITE DE COOPERATION 

EN M ATI ERE DE BREVETS (PCT) 



(19) Organisation Mondiale de la Propriete 
Intellectuelle 

Bureau international 

(43) Date de la publication Internationale 
15 fevrier 200J (15.02.2001) 




PCT 



(10) Numero de publication internationale 

WO 01/11605 Al 



(51) Classification internationale des brevets 7 : G 1 0L 11/02 (72) Inventeurs; et 

(75) Inventeurs/Deposants (pour US settlement): LUBIARZ, 



(21) Numero de la demande internationale: 

PCT/FROO/02220 

(22) Date de depot international: 2 aout 2000 (02.08.2000) 



(25) Langue de depot: 

(26) Langue de publication: 



francais 



Stephane [FR/FR]; 4, avenue Leon Heuzey, F-75016 Paris 
(FR). HINARD, Edouard [FR/FR]; 26, rue de ia Federa- 
tion, F-75015 Paris (FR). CAPMAN, Francois [FR/FR]; 
47, me des Etats Generaux. F-780OO Versailles (FR). 
LOCKWOOD, Philip [FR/FR]; 10, rue de TAmazone, 
F-95490 Vaureal (FR). 



francais (74) Mandataire: LOISEL, Bertrand: Cabinet Plasseraud, 
S4, rue d* Amsterdam. F-75440. Paris Cedex 09 (FR). 

(30) Donnees relatives a la priorite; 

99/10128 4 aout 1999 (04.08.1999) FR (81) Etats designes (national): AE, AC, AL, AM, AT. AU, AZ, 

BA. BB, BG, BR, BY, BZ, CA, CH, CN. CR, CU, CZ, DE, 
DK. DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM. HR, HU, 
ID, IL, IN, IS, JR KE, KG, KP, KR, KZ, LC, LK, LR, LS, 
LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ. NO, 

[Suite sur la page suivame] 



(71) Deposant (pour tous les Etats designes sauf US): MA- 
TRA NORTEL COMMUNICATIONS [FR/FR], 50, rue 
du President Sadate, F-29100 Quimper (FR). 



(54) Title: METHOD AND DEVICE FOR DETECTING VOICE ACTIVITY 
(54) Titre: PROCEDE ET DISPOSITIF DE DETECTION D* ACTIVITE VOCALE 



< 



Bn.i 



18 



DEBRUITAGE 

7 



CALCUL ENERGIES 
PAR BANDE5 



20' 



USSAGE 
ENERGIES 



21^ 



-laj 



C0NTR0LE 
AUTOMATES 




19 ... BAND ENERGY COMPUTING 
18 ... NOISE-CONNECTION MODULE 

20 ... TIME-RELATED ENERGY SMOOTHING 

21 ... AUTOMATION CONTROL 



w*. (57) Abstract: The invention concerns a method for detecting voice activity in a digital speech signal, in at least a frequency band, 
O for example by means of a detecting automaton whereof the status is controlled on the basis of an energy analysis of the signal. The 

control of said automaton, or more generally the determination of voice activity, comprises a comparison, in the frequency band, of 

two different versions of the speech signal one of which at least is a noise-corrected version. 



[Suite sur la page suivante] 



Express Mail No. EL732849804US 



wo 01/H605 ai i rim iiiiiii n imu mu mi i if nr run nin urn in 11 iur imm mi rm mi 



NZ. PL, PT, RO, RU. SD, SE. SG, SI, SK. SL, TJ, TM, TR, Publiee: 

TT, T2, UA, UG. US, UZ. VN. YU, ZA, ZW. — Avec rapport de recherche Internationale. 



(84) Etats designes (regional): brevet ARJPO (GH, GM, KE. 
LS, MW, MZ, SD, SL. SZ. TZ, UG, ZW), brevet eurasien 
(AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), brevet europeen 
(AT, BE, CH. CY, DE, DK, ES, FL FR, GB, GR, EE, IT. LU, 
MC NL, PT, SE), brevet OAPI (BF, BJ, CF, CG, CI, CM, 
GA, GN, GW, ML. MR, NE, SN, TD, TG). 



En ce qui concerne les codes a deux lettres et autres abrexia- 
tions. se referer aux "Notes explicatives relatives oilx codes et 
abreviations" figurant au debut de chaque nwnero ordinaire de 
la Gazette du PCT. 



(57) Abrege: On detecte une activite vocale dans un signal de parole numerique, dans au moins une bande de frequences, par 
exemple au moyen d'un automate de detection dont fetal est controle en fonction d'une analyse e'nergetique du signal. Le controle 
de cet automate, ou plus generaiement la decision d' activite vocale, comprend une comparaison, dans la bande de frequences, de 
deux versions differences du signal de parole dont Tune au moins est une version debruitee. 



WO 01/1 1605 



PCIYFROO/02220 



PROCEDE ET P1SPOS1T1F DE DETECTION D'ACTMTE VOCALE 

La presente invention concerne les techniques numeriques de 
traitement de signaux de parole Elle concerne plus particulierement les 
techniques faisant appel a une detection d'activite vocale afin d'effectuer des 
5 traitements differences selon que le signal supporte ou non une activite vocale. 

Les techniques numeriques en question relevent de domaines varies : 
codage de la parole pour la transmission ou le stockage, reconnaissance de la 
parole, diminution du bruit, annulation d'echo... 

Les methodes de detection d'activite vocale ont pour principale 
10 difficulty la distinction entre I'activite vocale et le bruit qui accompagne le signal 
de parole. 

Le document W099/14737 decrit un procede de detection d'activite 
vocale dans un signal de parole numerique traite par trames successives, dans 
lequel on procede a un debruitage a priori du signal de parole de chaque trame 

15 sur la base d'estimations du bruit obtenues lors du traitement d'une ou 
plusieurs trames precedentes, et on analyse les variations d'energie du signal 
debruite a priori pour detecter un degre d'activite vocale de la trame. Le fait de 
proceder a la detection d'activite vocale sur la base d'un signal debruite a priori 
ameliore sensiblement les performances de cette detection lorsque le bruit 

20 environnant est relativement important. 

Dans les methodes habituellement utilisees pour detecter I'activite 
vocale, les variations d'energie du signal (direct ou debruite) sont analysees 
par rapport a une moyenne a long terme de I'energie de ce signal, une 
augmentation relative de I'energie instantanee suggerant ('apparition d'une 

25 activite vocale. 

Un but de la presente invention est de proposer un autre type 
d'analyse permettant une detection d'activite vocale robuste au bruit pouvant 
accompagner le signal de parole. 

Selon I'invention, il est propose un procede de detection d'activite 

30 vocale dans un signal de parole numerique dans au moins une bande de 
frequences, suivant lequel on detecte I'activite vocale sur la base d'une analyse 
comprenant une comparaison, dans ladite bande de frequences, de deux 
versions differentes du signal de parole dont I'une au moins est une version 
debruitee obtenue en tenant compte d'estimations du bruit compris dans le 

35 signal 
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Ce procede peut etre execute sur toute la bande de frequence du 
signal, ou par sous-bandes, en fonction des besoins de 1'application utilisant la 
detection d'activite vocale. 

L'activite vocale peut etre detectee de maniere binaire pour chaque 
5 bande, ou mesuree par un parametre variant continument et pouvant resulter 
de la comparaison entre les deux versions differentes du signal de parole. 

La comparaison porte typiquement sur des energies respectives, 
evaluees dans ladite bande de frequences, des deux versions differentes du 
signal de parole, ou sur une fonction monotone de ces energies. 
10 Un autre aspect de la presente invention se rapporte a un dispositif de 

detection d'activite vocale dans un signal de parole, comprenant des moyens 
de traitement de signal agences pour mettre en ceuvre un procede tel que 
defini ci-dessus. 

L'invention se rapporte encore a un programme d'ordinateur, 
15 chargeable dans une memoire associee a un processeur, et comprenant des 
portions de code pour la mise en ceuvre d'un procede tel que defini ci-dessus 
lors de ('execution dudit programme par le processeur, ainsi qu'a un support 
informatique, sur lequel est enregistre un tel programme. 

D'autres particulates et avantages de la presente invention 
20 apparaitront dans la description ci-apres d'exemples de realisation non 
limitatifs, en reference aux dessins annexes, dans lesquels : 

- la figure 1 est un schema synoptique d'une chalne de traitement de 
signal utilisant un detecteur d'activite vocale selon l'invention ; 

• la figure 2 est un schema synoptique d'un exemple de detecteur d'activite 
25 vocale selon l'invention ; 

- les figures 3 et 4 sont des organigrammes d'operations de traitement de 
signal effectuees dans le detecteur de la figure 2, 

- la figure 5 est un graphique montrant un exemple devolution d'energies 
calculees dans le detecteur de la figure 2 et illustrant le principe de fa 

30 detection d'activite vocale ; 

• la figure 6 est un diagramme d'un automate de detection mis en ceuvre 
dans le detecteur de la figure 2 ; 

- la figure 7 est un schema synoptique d'une autre realisation d'un 
detecteur d'activite vocale selon Tinvention ; 

3 5 - la figure 8 est un organigramme d'operations de traitement de signal 

effectuees dans le detecteur de la figure 7 ; 
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- ia figure 9 est un graphique d'une fonction utilisee dans les operations de 
la figure 8. 

Le dispositif de la figure 1 traite un signal numerique de parole s. La 
chalne de traitement de signal representee produit des decisions d'activite 
5 vocale 5 n j utilisables de fa?on connue en soi par des unites d 1 application, non 

representees, assurant des fonctions telles que codage de la parole, 
reconnaissance de la parole, diminution du bruit, annulation d'echo... Les 
decisions 5 n j peuvent comporter une resolution en frequence (index j), ce qui 

permet d'enrichir des applications fonctionnant dans le domaine frequentiel. 

10 Un module de fenetrage 10 met le signal s sous forme de fenetres ou 

trames successives d' index n, constitutes chacune d'un nombre N 
d' echantillons de signal numerique. De facpon classique, ces trames peuvent 
presenter des recouvrements mutuels. Dans la suite de la presente description, 
on considerera, sans que ceci soit limitatif, que les trames sont constitutes de 

15 N = 256 echantillons a une frequence d'echantillonnage F e de 8 kHz, avec une 

ponderation de Hamming dans chaque fenetre, et des recouvrements de 50 % 
entre fenetres consecutives. 

La trame de signal est transformee dans le domaine frequentiel par un 
module 11 appliquant un algorithme classique de transformee de Fourier 
20 rapide (TFR) pour calculer le module du spectre du signal. Le module 11 
delivre alors un ensemble de N = 256 composantes frequentielles du signal de 
parole, notees S n f , ou n designe je numero de la trame courante, et f une 

frequence du spectre discret. Du fait des proprietes des signaux numeriques 
dans le domaine frequentiel, seuls les N/2 = 128 premiers echantillons sont 
25 utilises. 

Pour calculer les estimations du bruit contenu dans le signal s, on 
n' utilise pas la resolution frequentielle disponible en sortie de la transformee de 
Fourier rapide, mais une resolution plus faible, determinee par un nombre I de 
sous-bandes de frequences couvrant la bande [0, F e /2] du signal. Chaque 

30 sous-bande i (1 < i < I) s'etend entre une frequence inferieure f(i-1) et une 
frequence superieure f(i), avec f(0) = 0, et f(l) = F e /2. Ce decoupage en sous- 
bandes peut etre uniforme (f(i)-f(i-1) = F e /2I). II peut egalement etre non 

uniforme (par exemple selon une echelle de barks). Un module 12 calcule les 
moyennes respectives des composantes spectrales S n f du signal de parole 
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par sous-bandes, par exemple par une ponderation uniforme telle que : 

Ce moyennage diminue les fluctuations entre les sous-bandes en 
moyennant les contributions du bruit dans ces sous-bandes, ce qui diminuera 
5 la variance de I'estimateur de bruit. En outre, ce moyennage permet de 
diminuer la complexity du systeme. 

Les composantes spectrales moyennees S n j sont adressees a un 
module 15 de detection d'activite vocale et a un module 16 'd' estimation du 
bruit. On note B n j ('estimation a long terme de la composante de bruit produite 
10 par le module 16 relativement a la trame n et a la sous-bande i. 

Ces estimations a long terme B n] peuvent par exemple etre obtenues 
de la maniere decrite dans W099/14737. On peut aussi utiliser un simple 
lissage au moyen d'une fenetre exponentielle definie par un facteur d'oubli X B : 

§ n.i^BB n _1.i + ( 1 ^B)S n>j 
15 avec X B egal a 1 si le detecteur d'activite vocale 1 5 indique que la sous-bande i 

porte une activite vocale, et egal a une valeur comprise entre 0 et 1 sinon. 

Bien entendu, il est possible d' utiliser d'autres estimations a long terme 
representatives de la composante de bruit comprise dans le signal de parole, 
ces estimations peuvent representer une moyenne a long terme, ou encore un 

20 minimum de la composante S n j sur une fenetre glissante suffisamment longue. 

Les figures^2 a 6 illustrent une premiere realisation du detecteur 
d'activite vocale 15. Un module de debruitage 18 execute, pour chaque trame n 
et chaque sous-bande i, les operations correspondant aux etapes 180 a 187 de 
la figure 3, pour produire deux versions debruitees Ep 1ni , Ep 2 , n ,i du signal de 

25 parole. Ce debruitage est opere par soustraction spectrale non-lineaire. La 
premiere version Ep 1 n j est debruitee de fa?on a ne pas etre inferieure, dans 
le domaine spectral, a une fraction pi| de P estimation a long terme B n . x1i . La 
seconde version Ep 2t n,i est debruitee de fa?on a ne pas etre inferieure, dans le 
domaine spectral, a une fraction p2 s de V estimation a long terme B n . x1j . La 

30 quantite t1 est un retard exprime en nombre de trames, qui peut etre fixe (par 
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exemple x1 = 1) ou variable. II est d'autant faible qu'on est confiant dans la 
detection d'activite vocale. Les fractions p1j et j32j (telles que (31 s > p2 s ) peuvent 
etre dependantes ou independantes de la sous-bande i. Des valeurs preferees 
correspondent pour pij a une attenuation de 10 dB, et pour p2j a une 

5 attenuation de 60 dB, soit 01 8 « 0,3 et p2j « 0,001 . 

A I'etape 180, le module 18 calcule, avec la resolution des sous- 
bandes i, la reponse en frequence Hp n j du filtre de debruitage a priori, selon : 

u S n t i - a n-Tl t i B n-x1,i 
HPn.i = — 5 

ou t2 est un retard entier positif ou nul et a' n j est un coefficient de 

10 surestimation du bruit. Ce coefficient de surestimation a ni peut etre dependant 

ou independant de I' index de trame n et/ou de T index de sous-bande i. Dans 
une realisation preferee, il depend a la fois de n et i, et il est determine comme 
decrit dans le document W099/14737. Un premier debruitage est effectue a 

I'etape 181: Ep n i = Hp n i .S n { . Aux etapes 182 a 184, les composantes 
15 spectrales Ep-| n j sont calculees selon Ep-j n j =max(Ep n j; p1j.B n _ x -| et aux 
etapes 182 a 184, les composantes spectrales Ep 2( n,i sont calculees selon 
EP2,nJ = max (Ep n ,i; P2j.B n _ x1|j ). 

Le detecteur d'activite vocale 15 de la figure 2 comporte un module 19 
qui calcule des energies des versions debruitees du signal Epi ?n j et Ep2 ( n,j. 

20 respectivement comprises dans m bandes de frequences designees par T index 
j (1 < j < m, m>1). Cette resolution peut etre la meme que celle des sous- 
bandes definies par le module 12 (index i), ou une resolution moins fine 
pouvant aller jusqu'a I'ensemble de la bande utile [0, F e /2] du signal (cas 

m = 1). A titre d'exemple, le module 12 peut definir 1 = 16 sous-bandes 
25 uniformes de la bande [0, F e /2], et le module 19 peut conserver m = 3 bandes 

plus larges, chaque bande d' index j couvrant les sous-bandes d' index i allant 
de imin(j) a imax(j), avec imin(1) = 1 t iminQ+1) = imax(j) + 1 pour 1 < j < m, et 
imax(m) = I. A I'etape 190 (figure 3), le module 19 calcule les energies par 
bande : 
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imax(j) 

E 1,n.j = Z [ f ( i )- f ( i - 1 )]EPi 2 n ,i 

i=imin(j) 

imaxQ*) 

E 2 .n,j= Z I f 0)-f(i-1)]-Ep 2 2 nJ 
i=iminG) 

Un module 20 du detecteur d'activite vocale 15 effectue un lissage 
temporel des energies E 1 n j et E 2 nJ pour chacune des bandes cfindex j, ce qui 
5 correspond aux etapes 200 a 205 de la figure 4. Le lissage de ces deux 
energies est effectue au moyen d'une fenetre de lissage determinee en 
comparant I'energie E 2 n j de la version la plus debruitee a son energie lissee 

precedemment calculee E2,n-i,j. ou a une valeur de I'ordre de cette energie 
lissee E 2 ,n-i,j (tests 200 et 201). Cette fenetre de lissage peut etre une fenetre 
10 exponentielle definie par un facteur d'oubli X compris entre 0 et 1. Ce facteur 
d'oubli X peut prendre trois valeurs : I'une \ tres proche de 0 (par exemple 

X r = 0) choisie a I'etape 202 si E 2 n j < E 2 ,n-i,j ; 'a seconde X q tres proche de 1 

(par exemple k q = 0,99999) choisie a I'etape 203 si E 2 nj > A.E 2t n.i f j, A etant 

un coefficient plus grand que 1 ; et la troisieme X p comprise entre 0 et X q (par 

15 exemple X p = 0,98) choisie a I'etape 204 si E 2( n-i,j < E 2 nj < A. E 2 ,n-i,j- Le 

lissage exponentiel avec le facteur d'oubli X est ensuite effectue classiquement 
a I'etape 205 selon : 

/ 1 , n ,j=X.E 1(n . 1J+ (1-X).E 1>nj 

E2,n,j = ^- E 2> n-1,j + ( 1 -^) E 2.nj 
20 Un exemple de variation dans le temps des energies E 1 _ =, E-, _ = et des 

energies lissees E 1>n j et E 2>ni j est represente sur la figure 5. On voit qu'on 

arrive a un bon suivi des energies lissees lorsqu'on determine le facteur d'oubli 
sur la base des variations de I'energie E 2 n j correspondant a la version la plus 
debruitee du signal. Le facteur d'oubli X. p permet de prendre en compte les 
25 augmentations de niveau du bruit de fond, les diminutions d'energie etant 
suivies par le facteur d'oubli X r Le facteur d'oubli X q tres proche de 1 fait que 
les energies lissees ne suivent pas les augmentations d' energies brusques 
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dues a la parole. Le facteur fc q reste toutefois legerement inferieur a 1 pour 

eviter les erreurs causees par une augmentation du bruit de fond pouvant 
survenir pendant une assez longue periode de parole. 

L'automate de detection d'activite vocaie est controle notamment par 
5 un parametre resultant d'une comparaison des energies E 1 n j et E 2n j- Ce 

parametre peut notamment etre le rapport d n j = E 1 n j/E 2 n j. On voit sur la 

figure 5 que ce rapport d n j permet de bien detecter les phases de parole 

(representees par des hachures). 

Le controle de ['automate de detection peut egalement utiliser d'autres 
10 parametres, tels qu'un parametre lie au rapport signal-sur-bruit : 
snr n j = E 1 n j/&| fni j, ce qui revient a prendre en compte une comparaison entre 

les energies E 1 n j et Ej n j. Le module 21 de controle des automates relatifs 

aux differentes bandes d'index j calcule les parametres d n j et snr nj * a I'etape 

210, puis determine I'etat des automates. Le nouvel etat 5 n j de ('automate 

15 relatif a la bande j depend de I'etat precedent 5^ j, de d n j et de snr n j, par 

exemple comme indique sur le diagramme de la figure 6. 

Quatre etats sont possibles ; 8 j = 0 detecte le silence, ou absence de 

parole ; 5j=2 detecte la presence d'une activite vocaie ; et les etats 5j = 1 et 

5j = 3 sont des etats intermediates de montee et de descente. Lorsque 

20 ('automate est dans I'etat de silence (5 n . 1 j=0) l il y reste si d n j depasse un 
premier seuil a1 if et il passe dans I'etat de montee dans le cas contraire. Dans 
I'etat de montee (5^ j = 1 ), il revient dans I'etat de silence si d n j depasse un 
second seuil a2j ; et il passe dans I'etat de parole dans le cas contraire. 
Lorsque l'automate est dans I'etat de parole (8 n . 1 j = 2) f il y reste si snr n j 

25 depasse un troisieme seuil a3j, et il passe dans I'etat de descente dans le cas 

contraire. Dans I'etat de descente (5^ j = 3), l'automate revient dans I'etat de 

parole si snr n j depasse un quatrieme seuil a4j, et il revient dans I'etat de 

silence dans le cas contraire. Les seuils a1j, a2j, a3j et a4j peuvent etre 

optimises separement pour chacune des bandes de frequences j. 
30 II est egalement possible que le module 21 fasse interagir les 
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automates relatifs aux differentes bandes. 

En particulier. il peut forcer a I'etat de parole les automates relatifs a 
chacune des sous-bandes des lors que Tun d'entre eux se trouve dans I'etat de 
parole. Dans ce cas T la sortie du detecteur d'activite vocale 15 concerne 

5 I'ensemble de la bande du signal. 

Les deux annexes a la presente description montrent un code source 
en langage C++, avec une representation des donnees en virgule fixe, 
correspondant a une mise en ceuvre de I'exemple de procede de detection 
d'activite vocale decrit ci-dessus. Pour realiser le detecteur, une possibility est 

10 de traduire ce code source en code executable, de Tenregistrer dans une 
memoire de programme associee a un processeur de traitement de signal 
approprie, et de le faire executer par ce processeur sur les signaux d'entree du 
detecteur. La fonction a _priori_signal jjower presentee en annexe 1 
correspond aux operations incombant aux modules 18 et 19 du detecteur 

15 d'activite vocale 15 de la figure 2. La fonction voice_activity_detector presentee 
en annexe 2 correspond aux operations incombant aux modules 20 et 21 de ce 
detecteur. 

Dans Texemple particulier des annexes, les parametres suivant ont ete 
employes: t1 = 1 ; x2 = 0 ; (31j = 0,3; p2; = 0,001 ; m = 3; A = 4,953; 
20 Jl p = 0,98; 3^ = 0,99999; \ = 0; a1j = a2j = a4j = 1,221 ; a3j= 1.649. Le 
Tableau I ci-apres donne les correspondances entre les notations employees 
dans la precedente description et dans les dessins et celles employees dans 
Tannexe. 
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subband 


i 


E[subband] 


S n.i 


module 


Ed^ ; OU ED-i n ; OU FDo « : 


param. beta_a_priori 1 


P 1 i 


param. beta_a_priori2 




VdU 


i 1 

J— ' 


param. vad_number 


m 


P1[vad] 


E t,nj-1 


P1s[vad] 


E 1.nJ-1 


P2[vad] 




P2s[vad] 


"-2,n,j-1 


DELTA_P 


Log(A) 


d 


Log(d nj ) 


snr 


Log(snr nj ) 


NOISE 


etat de silence 


ASCENT 


etat de montee 




etat de parole 


DESCENT 


etat de descente 


D_NOISE 


Log(alj) 


D_SIGNAL 


Log(a2 j ) 


SNR_SIGNAL 


Log(a3j) 


SNR_NOISE 


Log(a4j) 



TABLEAU I 



Dans la variante de realisation illustree par la figure 7, le module de 
debruitage 25 du detecteur d'activite vocale 15 deiivre une seule version 
debruitee Ep ni du signal de parole, pour que le module 26 en calcule i'energie 
E 2 n j pour chaque bande j. U autre version dont le module 26 calcule I'energie 
est directement representee par les echantillons non debruites S n j. 

Comme precedemment, diverses methodes de debruitage peuvent etre 
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appliquees par le module 25. Dans I'exemple illustre par les etapes 250 a 256 
de la figure 8, le debruitage est opere par soustraction spectrale non-lineaire 
avec un coefficient de surestimation du bruit dependant d'une quantite p liee au 
rapport signal-sur-bruit. Aux etapes 250 a 252, un debruitage preliminaire est 
5 effectue pour chaque sous-bande d' index i selon : 

Sn,i =max(s nii -a.B n _ 1ii ;p.B n _ 1i j) f 

le coefficient de surestimation preliminaire etant par exemple a = 2, et la 
fraction p pouvant correspondre a une attenuation du bruit de I'ordre de 10 dB. 

La quantite p est prise egale au rapport S' ni /S ni a I'etape 253. Le 

10 facteur de surestimation f(p) varie de fa<?on non-lineaire avec la quantite p, par 
exemple comme represents sur la figure 9. Pour les valeurs de p les plus 
proches de 0 (p < p^, le rapport signal-sur-bruit est faible, et on peut prendre 
un facteur de surestimation f(p) = 2. Pour les valeurs les plus elevees de p 
(p 2 < p < 1), le bruit est faible et n'a pas besoin d'etre surestime (f(p)=1). Entre 

15 p 1 et p 2 , f(p) decroit de 2 a 1, par exemple lineairement. Le debruitage 

proprement dit, fournissant la version Ep n j , est effectue aux etapes 254 a 
256: 

Ep n j = max(s ai -f(p).B n .- M ; p.B n _ ti ). 

Le detecteur rfactivite vocale 15 considere en reference a la figure 7 
20 utilise, dans chaque bande de frequences d' index j (et/ou en pleine bande), un 
automate de detection a deux etats, silence ou parole. Les energies E 1 n = et 

E 2,nj calculees par module 26 sont respectivement celles contenues dans 
les composantes S n j du signal de parole et celles contenues dans les 
composantes debruitees Ep n j calculees sur les differentes bandes comme 

25 indique a I'etape 260 de la figure 8. La comparaison des deux versions 
differentes du signal de parole porte sur des differences respectives entre les 
energies E 1 nj * et E 2n j et un minorant de I'energie E 2n j de la version 
debruitee. 

Ce minorant E 2mjn j peut notamment correspondre a une valeur 
30 minimale, sur une fenetre glissante, de I'energie E 2nJ de la version debruitee 
du signal de parole dans la bande de frequences consideree. Dans ce cas, un 
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module 27 stocke dans une memoire de type premier entre - premier sorti 
(FIFO) les L valeurs les plus recentes de I'energie E 2n j du signal debruite 

dans chaque bande j, sur une fenetre glissante representant par exemple de 

I'ordre de 20 trames, et delivre les energies minimales E2min i = min ^2n-k i 

o^k<L 

5 sur cette fenetre (etape 270 de la figure 8). Dar^s chaque bande, cette energie 
minimale E 2min j sert de minorant pour le module 28 de controle de Tautomate 

de detection, qui utilise une mesure Mj donnee par Mj = — ?i2J 2min,j (etape 

^l,n,j ~~ ^2 m inj 

280). 

L'automate peut etre un simple automate binaire utilisant un seuil Aj, 

10 dependant eventuellement de la bande consideree : si Mj > Aj, le bit de sortie 

5 n j du detecteur represente un etat de silence pour la bande j, et si Mj < Aj, il 

represente un etat de parole. En variante, le module 28 pourrait delivrer une 
mesure non binaire de I'activite vocale, representee par une fonction 
decroissante de Mj. 

15 En variante, le minorant E 2min j utilise a Tetape 280 pourrait etre calcule 

. a I'aide d'une fenetre exponentielie, avec un facteur tfoubli. II pourrait aussi 
etre represente par I'energie sur la bande j de la quantite P-B^ j servant de 

plancher dans le debruitage par soustraction spectrale. 

Dans ce qui precede, r analyse effectuee pour decider de la presence 
20 ou de r absence tfactivite vocale porte directement sur des energies de 
versions differentes *du signal de parole. Bien entendu, les comparaisons 
pourraient porter sur une fonction monotone de ces energies, par exemple un 
logarithme, ou sur une quantite ayant un comportement analogue aux energies 
selon i'activite vocale (par exemple la puissance). 
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ANNEXE 1 

* description 

* — — — — — 

* NSS module: 

* signal power before VAD 



**************************************** 

















included files 


*/ 

iinclude <assert.h> 




#include "private. h" 












* 

* — — 


private 


*/ 

Word32 power (Wordl6 module, 


Wordl6 beta, Wordl6 thd, Wordl6 val); 










★ 

* — 


a_priori_signal_power 


*/ 

void a priori signal power 
( 



/* IN */ Wordl6 *E^Wordl6 *internal_state, Wordl6 *max noise, W 

ordl6 *long_term_noise, ~~ 
Wordl6 *f requential_scale, 



/* IN&OUT */ Wordl6 *alpha, 

/* OUT */ Word32 *P1, Word32 *P2 

) 

{ 

int vad; 

for (vad = 0; vad < pa ram. vad_number; vad++) { 

int start = param. vads [ vad] . f irst_subband_f or_power ; 

int stop = param. vads [vad] . last_subband; 

int subband; 

int uniform_subbahd; 

uniform subband =1; 
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for(subband = start; subband <= stop; subband++) 

if (param. subband_size [subband] != param . subband size [start] 

) 

unif orm_subband = 0 ; 

PI [vad] = 0; move32 () ; 
P2 [vad] = 0; move32 () ; 

test(); if (sub ( internal_state [vad] , NOISE) == 0) { 
for (subband = start; subband <= stop; subband++) { 
Word32 pwr; 
Wordl6 shift; 
Wordl6 module; 
Wordl6 alpha_long_term; 

alpha_long_term = shr <max_noise [ subband] , 2); move!6(); 
test ( ) ; test ( ) ; if (sub (alpha_long_term, long_tercn_noise [ 
subband] ) >= 0) { 

alpha [subband] = 0x7fff; movel6(); 

alpha_long_term « long_term_noise [subband] ; movel6(); 
} else if (sub (max_noise [subband] , long_term noise [subban 

d]) < 0) { 

alpha [subband] = 0x2000; move!6(); 

alpha_long_term = shr (long_term_noise [subband] , 2) ; mo 

vel6() ; 

} else { 

alpha [subband] = div_s (alpha_long_term, long_term_noi 
se (subband] ) ; movel6 ( ) ; 
} 

module = sub (E [subband] , shl (alpha_long_term, 2)); movel 

6 0; . 



if (unif orm_subband) { 

shift = shl (frequential_scale [subband] , 1); move!6(); 
} else { 

shift = add (param. subband_shift [subband] , shl(frequen 
tial_scale [subband] , 1)); move!6(); 
} 

pwr = powerfmodule, param. beta_a_prioril, long_term_nois 
e (subband] , long_term_noise [subband] ) ; 

pwr = L_shr (pwr, shift) ; 

PI [vad] = L_add(Pl [vad] , pwr); move32(); 

pwr = power (module, param. beta_a_priori2 , long_term_nois 
e [subband] , long_term_noise [subband] ) ; 

pwr = L_shr(pwr, shift); 

P2[vad] = L_add(P2 [vad] , pwr); move32(); 

} 

} else { 

for (subband = start; subband stop; subband++) { 
Word32 pwr; 
WordlS shift; 
Wordl6 module; 
Wordl6 alpha_long_term; 

alpha_long_term = mult (alpha [subband] , long_term_noise [s 
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ubband] ) ; movel6(); 

module = sub (E [subband] , shl (alpha_long_term, 2)}; movel 



61); 



if (uniform_subband) { 

shift = shl (frequential_scale [subband] , 1); movel6(); 

lea / 



} else { 
} 



shift - add (param. subband_shift [subband] , shlffrequen 
tial_scale [subband] , 1)); movel6(); 



r ^ ^ pwr = P° wer (module, param. beta a prioril, long term nois 
e [subband], E [subband]); ~ 

pwr = L_shr{pwr, shift); 

Plfvad] = L_add(Pl[vad] , pwr); move32(); 

f ^ pwr = P° wer (module, param. beta a priori2, long term nois 

e [subband], E [subband] ) ; 

pwr = L_shr(pwr, shift); 

P2(vad] = L_add(P2[vad] , pwr); move32(); 

) 

} 

} 



/* 

* 

* power 
*/ 

Word32 power (Wordl6 module, Wordl6 beta, Wordl6 thd, WordlS val) 
Word32 power; 

test{); if (sub (module, mult(beta, thd) ) <=0) { 
WordlS hi, lo; 

power = L_mult (vaJU val); move32(); 

L^Extract (power, £hi, &lo) ; 

power = Mpy_32_16(hi, lo, beta); move32(); 

L_Extract (power, &hi, &lo) ; 

power « Mpy_32_16(hi, lo, beta); move32(); 
} else { 

^ power = L_mult (module, module); move32{); 
return (power ) ; 

} 
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ANNEXE 2 



* description 

* NSS module: 

* VAD 
★ 

★ * * * * * y 



included files 



7 



#include <assert .h> 
# include "private . h" 
#include "simutool . h" 



private 



/ 



#define DELTA_P 
tdefine D_NOISE 
# define D_SIGNAL 
# define SNR_SIGNAL 
#define SNR NOISE 



(1.6 * 1024) 
(.2 * 1024) 
(.2 * 1024) 
(.5 * 1024) 
(.2 * 1024) 



voice_activity_detector 



void voice_activity_detector 
( 

/* IN */ Word32 *P1, Word32 *P2, Wordl6 frame_counter, 

/* IN&OUT */ Word32 *Pls, Word32 *P2s, Wordl6 *internal_state, 

/* OUT */ Wordl6 Estate 

) 
{ 

int vad; 
int signal ; 
int noise; 
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signal =0; movel6(); 
noise = 1; movel6{); 

for(vad = 0; vad < parara. vad_number; vad++) { 
WordlS snr, d; 
Wordl6 logPl, logPls; 
Wordl6 logP2, logP2s; 

logP2 « logfix (P2 [vad] ) ; move!6(); 
logP2s = logfix (P2s [vad] ) ; movel6(); 

testO; if (L_sub(P2[vad], P2s[vad]) > 0) { 
Wordl6 hil, lol; 
Wordl6 hi2, lo2; 

L_Extract (L_sub (PI [vad] , Pis [vad]), &hil, filol) ; * 
L_Extract (L_sub (P2 [vad] , P2s[vad]) / &hi2, &lo2) ; 

test(); if (sub (sub (logP2, logP2s), DELTA_P) < 0) { 

Pls[vad] = L_add(Pls [vad] , L_shr (Mpy_32_16 (hil, lol, 0x6 
666) , 4) ) ; iaove32 () ; 

P2s[vad] = L_add (P2s [vad] , L_shr (Mpy_32_16 (hi2, lo2, 0x6 
666) , 4) ) ; move32 () ; 

) else { 

Pis [vad] = L_add(Pls [vad] , L_shr (Mpy_32_16 (hil, lol, 0x6 
8db) , 13) ) ; move32 () ; 

P2s[vad] « L_add(P2s [vad] , L_shr (Mpy_32_16 (hi2, lo2, 0x6 
8db) , 13) ) ; move32 () ; 
} 

} else { 

Pis [vad] = PI [vad]; move32(); 
P2s(vad] = P2[vad]; move32(); 

} 

logPl = logfix (PI [vad] ) ; movel6(); 
logPls = logfix (Pis [vad] ) ; move!6(); 



d = sub(logPl, logP2); movel6(); 
snr = sub(logPl, logPls); move!6(); 



ProbeFixl6("d", &d, 1, 1.); 
ProbeFixl6 ("_snr", &snr, 1, 1.); 

Wordl6 pp; 

ProbeFixl6 ("pi", filogPl, 1, 1.); 
ProbeFixl6 ("p2", &logP2, 1, 1.); 
ProbeFixl6 ("pis", &logPls, 1, 1.); 
ProbeFixl6 ("p2s", &logP2s, 1, 1.); 
pp = logP2 - logP2s; 
ProbeFixl6 ("dp", &pp, 1, 1.); 
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test(); if (sub (internal_state [vad] / NOISE) == 0) 

goto LABELING I SE ; 

test(); if (sub ( internals tate [vad] , ASCENT) == 0) 

goto LABEL_ASCENT; 

test(); if (sub ( internal_s tate [vad] , SIGNAL) == 0) 

goto LABEL_S IGNAL ; 

test(); if (sub (internals tate [vad] , DESCENT) =« 0) 

goto LABEL_DESCENT; 

LABEL_NOI5E: 

test(); if (sub (d, D_NOISE) < 0) { 

internal_state [vad] = ASCENT; move!6(); 

} 

goto LABEL_END_VAD; 
LABEL_ASCENT: 

test(); if(sub(d, D_S IGNAL) < 0) { 

internal_state [vad] = SIGNAL; move!6(); 
signal = 1; move!6(); 
noise = 0; move!6(); 

} else { 

internal_state [vad] = NOISE; movel6(); 
} ■ - 

goto LABEL_END_VAD; 

LABEL_S IGNAL: 

test(); if(sub(snr, SNR_SIGNAL) < 0) { 

internal_state [vad] = DESCENT; movel6(); 

} else { 

signal = 1; movel6(); 

} 

noise * 0; movel6(); 
goto LABEL_END_VAD; 

LABEL_DESCENT: 

testt); if(sub(snr, SNR_NOISE> < 0) { 

internal_state [vad] = NOISE; movel6(); 
} else { 

internal_state [vad] = SIGNAL; move!6(); 
signal = 1; movel6(); 
noise = 0; movel6(); 

} 

goto LABEL_END_VAD; 
LABEL END VAD: 



♦state = TRANSITION; movel6(); 
test(); test(); if (signal ! = 0) { 

test(); if (sub (f rame^counter, param. init_f rame_number) >- 0) { 
for (vad = 0; vad < param. vad_number; vad++) { 
internal_state[vad] = SIGNAL; move!6(); 

> 

* state « SIGNAL; move!6(); 
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} else if (noise != 0) { 

*state = NOISE; move!6(); 

} 
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REVENDICATIONS 

1. Procede de detection d'activite vocale dans un signal de parole 
numerique (s) dans au moins une bande de frequences, caracterise en ce 
qu'on detecte I'activite vocale sur la base d'une analyse comprenant une 

5 comparaison, dans ladite bande de frequences, de deux versions differentes 
du signal de parole dont Tune au moins est une version debruitee obtenue en 
tenant compte d'estimations du bruit compris dans le signal. 

2. Procede selon la revendication 1, dans lequel ladite comparaison 
porte sur des energies respectives (E 1 n j, £2,0 j)» evaluees dans ladite bande 

10 de frequences, des deux versions differentes du signal de parole, ou sur une 
fonction monotone desdites energies. 

3. Procede selon la revendication 1 ou 2, dans lequel ladite analyse 
comprend en outre un lissage temporel de I'energie (E 1 n j) d'une desdites 

versions du signal de parole, et une comparaison entre I'energie de ladite 
15 version et Tenergie lissee ( E-| n j). 

4. Procede selon la revendication 3, dans lequel la comparaison entre 
I'energie de ladite version (E 1t nj) et I'energie lissee (E 1n j) controle les 

transitions d'un automate de detection d'activite vocale d'un etat de parole vers 
un etat de silence, tandis que la comparaison des deux versions differentes du 
20 signal de parole controle les transitions de r automate de detection de I'etat de 
silence vers I'etat de parole. 

5. Procede selon Tune quelconque des revendications 1 a 4, dans 
lequel les deux versions differentes du signal de parole sont deux versions 
debruitees par soustraction spectrale non-lineaire, une premiere des deux 

25 versions (Ep lAi ) etant debruitee de fa$on a ne pas etre inferieure, dans le 
domaine spectral, a une premiere fraction (p1j) d'une estimation a long terme 
(B ni ) representative d'une composante de bruit comprise dans le signal de 
parole, et la seconde des deux versions (Ep^n.i) etant debruitee de fagon a ne 
pas etre inferieure, dans le domaine spectral, a une seconde fraction (p2j) de 

30 ladite estimation a long terme, plus petite que la premiere fraction. 
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6. Procede selon la revendication 5, dans lequel on effectue un lissage 
tempore! de I'energie de chacune des deux versions du signal de parole, au 
moyen d'une fenetre de lissage determinee en comparant I'energie (E 2 n j) de 

la seconde des deux versions a I'energie lissee ( E^nj) de la seconde des deux 

5 versions. 

7. Procede selon la revendication 6, dans lequel la fenetre de lissage 
est une fenetre exponentielle definie par un facteur d'oubli {X). 

8. Procede selon la revendication 7, dans lequel le facteur d'oubli (X) a 
une valeur {X r ) sensiblement nulle lorsque I'energie (E 2 n j) de la seconde des 

10 deux versions est inferieure a une valeur de Tordre de I'energie lissee (E 2n j) 

de la seconde des deux versions. 

9. Procede selon la revendication 8, dans lequel le facteur d'oubli (X) a 
une premiere valeur {X q ) sensiblement egale a 1 lorsque I'energie (E 2 n j) de la 
seconde des deux versions est superieure a ladite valeur de Tordre de I'energie 

15 lissee multipliee par un coefficient (A) plus grand que 1, et une seconde valeur 
(X p ) comprise entre 0 et ladite premiere valeur lorsque I'energie de la seconde 

des deux versions est superieure a ladite valeur de I'ordre de I'energie lissee et 
inferieure a ladite valeur de Tordre de Tenergie lissee multipliee par ledit 
coefficient. 

20 10. Procede ^elon Tune quelconque des revendications 5 a 9, dans 

lequel les premiere et seconde fractions p2j) correspondent sensiblement 
a des attenuations de 10 dB et de 60 dB, respectivement 

11. Procede selon Tune quelconque des revendications 1 a 10, dans 

lequel la comparaison des deux versions differentes du signal de parole porte 
25 sur des differences respectives entre les energies (E 1n j, E 2 n j) de ces deux 
versions dans ladite bande de frequences et un minorant (E 2m j n j) de Tenergie 
(E 2n p de la version debruitee du signal de parole dans ladite bande de 
frequences. 
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12. Precede selon la revendication 11, dans lequel i'une des deux 
versions differentes du signal de parole est une version non debruitee du signal 
de parole. 

13. Dispositif de detection d'activite vocale dans un signal de parole, 
5 comprenant des moyens de traitement de signal (15) agences pour mettre en 

oeuvre un precede selon Tune quelconque des revendications 1 a 12. 

14. Programme d'ordinateur, chargeable dans une memoire associee a 
un processeur, et comprenant des portions de code pour la mise en ceuvre 
d'un procede selon Tune quelconque des revendications 1 a 12 lors de 

10 T execution dudit programme par le processeur. 

15. Support informatique, sur lequel est enregistre un programme selon 
la revendication 14. 
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